導讀:即使2018年對數(shù)據(jù)中心正常運行時間的新威脅繼續(xù)出現(xiàn),已知的原因?qū)е挛覀兘衲昕吹降拇蠖鄶?shù)數(shù)據(jù)中心停機。根據(jù)Uptime Institute今年夏天公布的調(diào)查結(jié)果顯示,近三分之一的數(shù)據(jù)中
發(fā)表日期:2020-02-08
文章編輯:興田科技
瀏覽次數(shù):7983
標簽:
即使2018年對數(shù)據(jù)中心正常運行時間的新威脅繼續(xù)出現(xiàn),已知的原因?qū)е挛覀兘衲昕吹降拇蠖鄶?shù)數(shù)據(jù)中心停機。
根據(jù)Uptime Institute今年夏天公布的調(diào)查結(jié)果顯示,近三分之一的數(shù)據(jù)中心在過去一年中發(fā)生了中斷事故,而前一年則為25%。但這一增長并不是由于一些致命的新惡意軟件造成的。
相反,導致停機的三大原因是斷電(33%)、網(wǎng)絡故障(30%)以及IT或軟件錯誤(28%)。
最重要的是,80%的數(shù)據(jù)中心經(jīng)理表示他們最近的停機事故是可以預防的。
您無法阻止雷擊(例如9月份在圣安東尼奧市拆除Microsoft Azure數(shù)據(jù)中心的雷擊)或零日惡意軟件攻擊。但是,通過適當?shù)囊?guī)劃和數(shù)據(jù)中心設計,由于意外的天氣事件、攻擊、常規(guī)人為錯誤或未打補丁的系統(tǒng)導致的中斷,可以最大限度地減少影響。
在中斷發(fā)生后,使數(shù)據(jù)中心快速啟動并運行同樣重要。根據(jù)信息技術(shù)情報咨詢公司今年的報告,平均每小時的停機時間將花費數(shù)據(jù)中心運營商26萬美元,而5分鐘的停機時間僅花費2600美元。
基礎(chǔ)設施冗余仍然有效
在最基本的層面上,數(shù)據(jù)中心系統(tǒng)需要備份。備份電源和冷卻系統(tǒng)、備份數(shù)據(jù),甚至備份整個數(shù)據(jù)中心。
備份工作。據(jù)Uptime稱,在擁有2N個用于冷卻和電源的架構(gòu)的數(shù)據(jù)中心(換句話說,一個完全冗余的、鏡像的系統(tǒng))中,22%的數(shù)據(jù)中心去年發(fā)生過故障。這比那些選擇低成本,非完全冗余的N + 1方法的人減少了三分之一的停機,和33%的人報告了斷電。
完整的數(shù)據(jù)中心備份可提供更高的可靠性。根據(jù)Uptime的數(shù)據(jù),40%的數(shù)據(jù)中心經(jīng)理表示他們會在兩個或多個站點上復制工作負載和數(shù)據(jù)。
“如果你只有一個數(shù)據(jù)中心并且遇上雷擊,那么你就麻煩了?!盨SH 通信安全公司首席技術(shù)官馬爾庫羅西表示?!澳銘撚幸粋€輔助數(shù)據(jù)中心,它們之間具有物理隔離,不依賴于相同的能源?!?/p>
他補充道,沒有任何數(shù)據(jù)中心能夠幸免于這個問題的影響,他指的是9月份微軟位于美國中南部的數(shù)據(jù)中心。
“有第二個設置并立即進行故障轉(zhuǎn)移?!彼f
無論什么備份系統(tǒng)到位,規(guī)劃和測試都是關(guān)鍵,Rossi補充說,規(guī)劃需要考慮當今數(shù)據(jù)中心的復雜性,其中問題可能引發(fā)其他問題。
他使用了最近在物理維護期間發(fā)生的GitHub中斷作為例子。“他們在幾分鐘內(nèi)修復了物理問題,但需要24小時才能使數(shù)據(jù)正確同步?!彼f。
數(shù)據(jù)中心經(jīng)理需要查明潛在的問題區(qū)域,然后在發(fā)生事情時準備好工具和流程。
羅西說:“專注于建立流程,建立你為失敗做準備所需的心態(tài)?!?/p>
加強中心,不僅僅是周邊
數(shù)據(jù)中心管理人員應該從最近發(fā)生的與惡意軟件相關(guān)的中斷中吸取的最大教訓之一就是,僅僅有一個堅固的外圍是不夠的。
今年醫(yī)療保健公司、政府機構(gòu)、教育機構(gòu)和主要制造商都受到了沖擊,盡管在去年創(chuàng)紀錄的違規(guī)行為之后,每個人都應該已經(jīng)處于高度戒備狀態(tài)。
顯然,保持最新防御,防止惡意軟件首先進入是至關(guān)重要的。但數(shù)據(jù)中心管理人員必須準備好看到他們的外圍防御失敗并具備二級保護。
其中包括惡意流量檢測機制、網(wǎng)絡防御(如分段)、最低權(quán)限的訪問和通信方法。
總部位于以色列的網(wǎng)絡安全公司GuardiCore的產(chǎn)品管理總監(jiān)伊格爾利夫茨茨表示,這些可能有助于防止惡意軟件進入網(wǎng)絡后傳播,或至少減緩其速度,使安全團隊有機會做出回應。
WannaCry特別利用了服務器消息塊傳輸協(xié)議中的漏洞。他說,數(shù)據(jù)中心應該采取更多措施來減少橫向通信。
“在過去一年中WannaCy勒索軟件的許多案例中,造成攻擊廣泛影響的主要原因是,一旦這些蠕蟲在數(shù)據(jù)中心內(nèi)立足,就很容易擴散?!崩虼拇恼f?!笆聦嵣希掌髦g的SMB流量根本不是必需的。如果它被阻止,攻擊的擴散和對數(shù)據(jù)中心的破壞可能會大大減少,并且在之前的早期階段就會檢測到攻擊造成了這么大的傷害?!?/p>
今年違規(guī)的重要教訓并不是數(shù)據(jù)中心經(jīng)理必須防范的新威脅。他們需要重新回歸基礎(chǔ)。
幾乎所有的數(shù)據(jù)中心停機都是由于糟糕的規(guī)劃和投資決策,加上流程不良或無法遵循流程,Uptime Institute研究執(zhí)行主任安迪勞倫斯在6月份的報告中寫道。“幾乎所有由正常運行時間研究所報告或研究的故障以前都發(fā)生過,而且通常有詳細的文檔記錄?!?/p>
雷電襲擊和新型惡意軟件可能占據(jù)所有頭條新聞,但它在恢復能力方面仍然是最重要的基礎(chǔ)知識。
更多新聞
2020
中國手機“挺進”美國市場,三個月內(nèi)售出220萬部,僅次于LG目前,中國手機品牌在全球市場上風頭正勁。即使華為被美國制裁,手機海外銷量大幅下滑,但小米、OPPO、vivo等品牌的強勢
View details
2020
不談機器倫理!陸還曝光了“千元神機”,跑34萬積分,大量使用5天如果說這兩天數(shù)字圈有什么熱點的話,小米副總裁盧一定要發(fā)布新機紅米Note 9系列。本次發(fā)布會共推出三款手機,官方
View details
2020
最強千元機?Redmi Note 9高度配手,性價比不談機器倫理親愛的朋友們,昨晚我不喜歡看紅米Note 9系列的發(fā)布。給李祝壽的魯老師當場說:“有經(jīng)驗?被罵沒貨?雷老是激動?”老虎和狼
View details
2019
Infomart公司新建的數(shù)據(jù)中心即將開通運營。但到了2019年初,人們期待看到批發(fā)數(shù)據(jù)中心提供商的新品牌,以及經(jīng)驗豐富的管理團隊和擁有雄厚財力和雄心壯志的業(yè)主。Infomart公司新
View details